2
多維張量的線性現實
AI023Lesson 7
00:00

雖然我們為了數學上的便利,將資料視覺化為二維格子,但硬體僅能看見一個 連續的 1 維字節流。理解這種「線性現實」是實現列向運算模式的前提 簡化模式——例如尋找最大值或指數總和。

1. 「線性展平」原理

每個多維張量在物理上都是依序儲存的。要實作 $\text{softmax}(x_i) = \frac{e^{x_i}}{\sum_j e^{x_j}}$,我們必須識別代表一列的線性區段,並進行遍歷以計算最大值與總和。

2D 數學邏輯1D 物理記憶體

2. 數值穩定性

為什麼 Softmax 需要穩定化?高輸入值會導致 $e^{x}$ 崩潰。我們透過以下方式進行穩定化:$$\text{exp}(x_i - \text{max}(x))$$ 這迫使核心設計者在最終歸一化前執行兩次線性簡化(先求最大值,再求總和)。

3. 透過短列驗證

在開發 Triton 核心時,我們使用 僅測試短列 (例如寬度為 16)來確保我們的線性指標運算能正確捕捉每一筆元素,才逐步擴展至生產環境工作負載。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>